import bs4
from bs4 import BeautifulSoup

htmlContent = """

<ul>
<li><a href="123.com">123333333</a></li>
<li id="456"><a href="456.com">45666666</a></li>
<li><a href="789.com">78999999</a></li>
<li><a href="123.com">12333333</a></li>
</ul>

"""
# 1.初始化BeautifulSoup对象page,传入的 HTML 字符串,解析器类型指定为 "html.parser"，
page = BeautifulSoup(htmlContent, "html.parser")
# page.find("标签名",attrs={"属性":"值"})  # 查找一个元素，只会找到一个结果
# page.find_all("标签名",attrs={"属性":"值"})  # 找到所有结果

# # 查找一个 li 标签，该标签具有 id 属性值为 "456"：
# li = page.find("li", attrs={"id": "456"})
# # 从找到的 li 标签中继续使用 find() 方法查找其中的 a 标签：
# a = li.find("a")
# print(a)  # 打印出这个 <a> 标签
# print(a.text)  # 使用 text 属性获取 a 标签内的文本内容
# print(a.get("href"))  # 使用 get() 方法获取 a 标签的 href 属性值：

# 查找所有 li 标签
li_list = page.find_all("li")
# print(li_list)  #直接输出就是一坨
for li in li_list:  # 循环遍历 li_list 中的每个 <li> 标签
    a = li.find("a")
    text = a.text
    href = a.get("href")
    print(text, href)
